查看原文
其他

【漫画解读】数据治理:元数据是个啥,它有啥用?

信创咨询 2022-07-03


1、元数据的定义:


元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),对数据及信息资源的描述性信息。元数据是所有数据中最重要的数据,也是整个银行业数据和计算机软件的基础。

如体检报告中的 "年龄"、"身高"、"体重"、"性格",就是元数据,因为它们是用来描述具体数据/信息的数据/信息 。


再比如,图书馆的藏书信息卡。视频网站里的视频描述、网络中的网页地址等等都是元数据。

还有“财务状况表”中的属性字段,如:机构名称、项目名称、币种、余额信息等都是这张表格的元数据信息。

2、元数据的分类:

元数据按其描述对象的不同可以分3大类:技术元数据、业务元数据和管理元数据。

技术元数据

技术元数据主要用来描述数据实体和数据处理过程中的技术细节和处理规则。比如大家熟知的表结构、ETL映射关系等,这类元数据主要被系统建设的技术人员使用。

在银行业,技术元数据解决了业务系统(如综合柜面系统、信贷业务系统、网络银行系统、电话银行系统等)和管理系统(客户关系管理系统、审计管理系统、财务管理系统等)的数据定义、获取、存储、交换和应用等功能。

业务系统是负责银行与客户之间进行交易的系统,这些系统有数据量大、时效性强等特点。如以“综合柜面系统”为例,“综合柜面系统”要管理上亿的客户信息、账务报表,每天实时处理上亿笔的交易。技术元数据在这些系统里面大部分以数据库定义的形式存在,是各类数据处理的基础。

业务元数据

业务元数据主要是对IT系统的数据实体和数据处理的业务化描述,包括业务规则、业务术语、统计口径、信息分类等。大家经常提及的 KPI定义 和 报表统计规则 等就属于此类元数据。业务元数据主要的使用者是业务人员和公司决策人员。

1、对业务本身描述

如目前银行业可分为3大类产品,资产类、负债类、中间业务类。

资产类产品又可分为短期信贷、长期信贷、贴现类等。

这些业务的描述和定义构成了业务元数据的基础。

2、对业务经营状况的描述

包括对银行产品、银行机构、银行客户经营情况的总的反映。每个分支机构每个时间段、时间点各个产品或业务有不同的业务经营情况。

3、业务管理情况的描述

包括各类业务管理规章制度、经营案例、经营要点难点等。业务元数据在业务管理方面也起到定义管理指标和标准的作用。

对资源的内容、属性进行详细全面的描述,完整反映信息资源对象的基础概貌是元数据的基本功能。

管理元数据

管理类元数据主要是对项目管理、IT运维、IT资源设备等相关信息的描述,这类元数据主要被企业IT部门的管理人员使用,利用此类元数据可以进行工作分配、网络资源等方面的管理。在这里,把管理元数据也纳入到业务元数据研究的范畴,即在本文中元数据只分为技术元数据与业务元数据。

3、元数据的功能:

1. 数据资产地图


一图在手,天下我有自从有了这张数据地图,腿不酸了、腰不痛了,上楼也有劲了!


数据地图一般用于在宏观层面组织信息,

以全局视角对信息进行归并、整理,

展现数据量 、数据变化情况 、

数据存储情况 、整体数据质量 等信息,

为数据管理部门和决策者提供参考。



2. 快速搜索

快速搜索定位各类信息系统的数据资产,

用来查询及使用。

3. 灵活视角

支持用户自定义多视角的数据查找,

通过用户预期方式找到所需的数据在什么位置,

并提供数据资产的快速展现。

4. 数据标签

用户可以快速通过数据标签关联

查找出所需的数据位置。

5. 洞察数据资产

提供数据资产分布和数据资产评估自评估功能,

深入了解数据资产的全局情况。


6. 血脉分析

通过元数据血缘关系分析,

可以理解不同数据间的关系。

7.  影响性分析

通过分析数据表之间的关系,

展示数据源波动带来的影响。

8. Mapping展示

帮助用户掌握理解

业务口径与数据口径之间的映射关系,

以用户需要的方式“翻译”出来。

4、元数据的作用:

理解数据,建立数据思维

元数据能够有效帮助技术人员和业务人员理解、监督和管理数据的来源、转换规则以及数据变更管理等信息。


提升工作效率

集中式的元数据管理模式,有效提高技术开发人员和数据分析人员的工作效率。

自助式使用数据

提供良好的元数据查询管理视图,可使业务人员独立准确地定位和使用数据。

提高数据质量

有利于构建元数据管理组织、元数据标准和流程,准确定义元数据范围,进而保证省联社各IT业务系统中元数据的完整性和正确性。

跨系统互联互通

有效支持各IT系统之间的数据转换兼容,实现数据共享和互联互通。


结语:


元数据是企业数据资源的应用字典和操作指南,元数据管理有利于统一数据口径、标明数据方位、分析数据关系、管理数据变更,为企业级的数据战略规划、数据模型设计、数据标准管理、主数据管理、数据质量管理、数据安全管理以及数据的全生命周期管理提供支持,是企业实现数据自服务、推动企业数据化运营的可行路线。企业以元数据为抓手进行数据治理,帮助企业更好地对数据资产进行管理,理清数据之间的关系,实现精准高效的分析和决策。

本文来源于:谈数据 公众号

温馨提示

如果你喜欢本文,请分享到朋友圈,想要获得更多相关资料,请关注“信创工程咨询”。我们的推送时间是18:00或24:00,一定不要忘了给“信创工程咨询”设星标哦!


相关阅读



六大国产CPU | 全面梳理分析

硬核 | 公安部五亿采购国产服务器等设备大单被废标!

农行率先采购2000台国产服务器 | 金融业“新基建”悄然而至

中国新基建459家细分领域龙头名单

市场监管总局等六部门印发《国家电子政务标准体系建设指南》(附下载)

华为项目管理法10大模板【Excel版(可下载套用)】

到底什么是“云网融合”?

5G和AI双引擎 | 中国10万亿元投资新基建!(附报告下载

从政务云到“新基建”,政务数字化转型迈入新阶段

依托亦庄信创园,建设信创应用生态  | 北京“新基建”政策终于来了!

为什么说ARM可能是国产计算架构的最优选择

重磅 | 工信部副部长陈肇雄调任中国电科董事长、党组书记!

当“信创”与“新基建”不期而遇,万亿级风口你准备好了吗?

网络安全等级保护2.0的要求及所需设备的清单

31个省市大盘点!400万以下不用公开招标!

干货:服务器基础知识全解(汇总版)

操作系统深度研究(PPT原文)

5.6万台!中国电信启动2020年服务器集采

全国首个「多云架构的政务云」案例分析(完整版可下载)

谁是山东省政府信息化项目的标王?

江苏信创大会在无锡召开 | 江苏信创产业生态基地揭牌

ARM中国CEO被免职,华为或遭全面断供

国家电网发布“数字新基建”十大重点建设任务

信创云产业发展与生态建设视频会议成功召开!(附下载链接)

鹅厂5000亿PK猫厂2000亿 | 腾讯和阿里入局新基建

官宣!新基建真的来了,这些城市抢先一步

广州新基建三年行动计划 | 1800亿73个重大数字新基建项目

昆明 “新基建”394个重点项目 | 总投资1万亿元(附清单下载)

福建省人民政府办公厅关于印发2020年数字福建工作要点的通知

《信创政务云应用软件质量测评规范(试行)》发布

《新基建产品手册》最新出炉 | 60页可下载

看懂云计算、虚拟化和容器,这一篇就够啦!

“新基建”政策白皮书(附下载方式)

安徽发布第一批【896项】新基建技术产品服务目录(附下载)

“新基建”中的大数据中心,该是什么样?| 弯道超车的“新基建”

上海版“新基建”35条重磅发布 | 首批重大项目投资2700亿

Win7停服,引发国产操作系统“蝴蝶效应”

中国移动2020年度13.8万台服务器、80亿元采购大单意味着什么

“新基建”必须走自主可信创新之路

国家发改委将出台“新基建”政策 | 实施全国一体化大数据中心建设

重磅发布 | 等保2.0定级指南GBT 22240-2020(附下载方式)

《2020城市新基建布局与发展白皮书》发布(可下载)

新基建深度报告:新基建浪潮中的七大领域十大龙头分析

新基建时代下,“华为云”战略投入转向政企市场

信息化行业的“两会行情” | 两会期间“新基建”预期升温

地方版新基建加速落地 | 全国16省市新基建政策方案一览

某县级市城市大脑项目建设方案

两会知识点 | “两新一重”指的是什么?

《互联网周刊》重磅发布 | 2020年信创企业50强




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存